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L' invention concerne un precede de correction multi 
references des deformations spectrales de la voix- 
introduites par un reseau de communication, Elle 
concerne egalement un systeme pour la mise en oeuvre du 
5 procede. 

La presente invention a pour but 1 ' amelioration de 
la qualite de la parole transmise sur les reseaux de 
communication, en offrant des moyens pour corriger les 
deformations spectrales du signal de parole, 
10 deformations provoquees par differents maillons de la 
chalne de transmission du reseau . 

La description qui en est donnee dans la suite fait 
explicitement reference a la transmission de la parple 
sur lignes telephoniques "classiques" (c ' est-a-d|.re 
.15 filaires), mais elle s'applique egalement a tout t^pe 
• ■ de reseau de - communication (fixe, mobile ou autre) 
introduisant des deformations spectrales dans le- 
signal, les parametres pris comme reference pour 
qualifier le reseau devant etre modifies en f onctionj^^du 

20 reseau, v3: 

On va rappeler dans ce qui suit les differentes 
■ deformations rencontrees dans le cas du Reseau 
Telephonique Commute (RTC) . 

l.i; Les degradations du timbre de la" voix sur le 

25 Reseau RTC : . 

La figure 1 represente un schema d'une liaison RTC. 
La parole emise par un locuteur est transmise par un 
^terminal emetteur 10, transportee par la ligne d'abonne 
20, subit une conversion 30 analogique-numerique (loi 

30 ' A), est transmise par le reseau numerique 40, subit une 
■conversion numerique (loi A)- ahalogique 50, est 
transmise par la liaison d'abonne 60, passe par le 
terminal recepteur 70 pour etre enf in . regue par le 
destinataire . 
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■ Cha,^e locuteur est reli4 par un. l.gne --log 
(paire torsad^e) au central telephon.que le plus 
proche. II s'agit d-une trans.i.sio. a„alog..ue en 
Lnde de base r^f.rence X et 3 sur la txgure 1^ La 
liaison entre les centraux, e.prunte - 
entl*re:nent nu^.rique 40. Le spectre de la voxx est 
aifecta par deux types de distorsions lors de 
transmission analogi^ue du signal en bands J^^J^; 

Le premier type de distorsion est le f-""^e 
passe-bande des terminaux et des points d'aoces a la 
^ . ■ H„ rSseau Les caracteristiques 

ryrits r ::Trltr;e - d^entes P"^-l.-. so s 

J no. de -yst..e de r.«rence inter.edr^a re .SKI, 

riiTT-T Recommandation r.^o, 

^ . a.' iT^o -i clones de mesures 

caracteristiques f requentielles. issues 

^nnees 70, tendent cependant a 
-rt^^p^lisees dans les annees 

aevenir obsol.tes. Cest pourquo. ^J^^f 

deouis 1996 d'utiliser un SRI moctxrie 
depuxs ly caracteristxque 
Recommandation P.83U, lyyoj . ^^ri-ie 
nominale est representee sur la figure 2 pour la partre 
nomina ^ . ^ure 3 pour la partie reception. 

Emission, et sur la figure 3 po f 

Entre 200 et 3400 Hz, la tolerance est de ± ^,5 dB , en 
dessous de 200 Hz, la decroxssance de la 
aessou^ ^ , , Honi- F'tre d'au moms 

caracteristique du systeme global doit etre 
■ 15 dB par octave. On appelle respectxvement , selon la 

^ . ^ T.„TT T "svsteme emetteur" et "systeme 
terminologie de I'UIT-T, sysrem ^ . ^ .„ 

recepteur" les parties emission et receptxon du SRI 

ta seconde distorsion affectant le spect.e de la 
.oix est l-att.nuation des lignes d'abonn.. Dans un 
HI. simple de la ligne analogique locale- [donne dans 
L: T^^^^^^^^^ cL. ..^.^^^^^^S. pa. Cadoret 

.^^ ^,-,0 rolle-c-i introduxt un 

19831 on considere que cexie c_ . 
1983J, on ,.„nal dont la valeur en dB depend 

affaiblissement du sxgnal dont xa ^acine 
de sa longueur .et est proportionnelle a la racxne 
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carree de la frequence. L' af f aiblissement est de 3 dB a 
800 HZ pour une ligne moyenne (environ 2 km), de 9,b dB 
^ 800 Hz pour les lignes les plus longues (jusqu'a 10 
km). Selon ce modele, 1' aff aiblissement d' une ligne, 
represents sur la figure 4, a pour expression : 



A^if)-A,,(%OOHz).^ (0.1) 

A ces distorsions s'ajoute le filtrage anti- 
repliement du codeur MIC (ref 30). Celui-ci est 
typiquement un filtre passe-bande 200-3400 Hz avec une 
reponse presque plate sur la bande passante et une 
forte attenuation en dehors de la bande, selon le 

J 1= -F-irnirp 5 par exemple [NationaL- 
gabarit de la figure o pa 

^ ;:,oi-it- 1994 : Documentation technique- 

Semiconductor, aouc 1:^2"* 

« TP3054 ,TP3057 ] . " • ^ -, ^" 

Au final, la voix subit une distorsion spectrale 
telle que representee sur la figure 6 pour les 
differentes combinaisons de trois types, de Ixgne 
-analogique en emission et en reception (sort | 
distorsions), sous I'hypothese d' equipements respectant, 
la caracteristique nominale du SRI modifie. La voix 
apparait ainsi etouff^e si une des lignes analogiques 
est longue et souffre .dans tous les cas d'un manque de 
"presence" du a 1 ' aff aiblissement des coraposantes basse 

frequence. • . 

1 2 Les degradations du timbre de la voix sur le 
Reseau Numerique a Integration de Services (RNIS) et le 

reseau mobile GSM. 

Dans le RNIS et ' le reseau GSM, le signal est 
numerise des le terminal. Les ■ seules parties 
analogiques sont les transducteurs en emission et en 
reception associes a leurs chaines d ' amplification et 
de conditionnement respectives. L'UIT-T a defini des 
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gabarits d'efficacite en frequence a 1* emission 
representes sur la figure 7^ et a la reception 
represents sur la figure 8, valables a la fois pour les 
telephones numeriques filaires [UIT-T, Recommandation 
P. 310, mai 2000] et les terminaux numeriques mobiles ou 
sans fil [UIT-T, Recommandation P-313, septembre 1999]. 

Par ailleurs, pour les reseaux GSM, il est reconnu 
que le. codage et le decodage modifient legerement 
l^enveloppe spectrale du signal- Cette alteration est 
representee sur la figure 9 pour un bruit rose code 
puis decode en mode EFR (Enhanced Full Rate) . 

L^effet de ces filtrages sur le timbre est 
principalement un af f aiblissement des composantes basse 
frequence, moins marque cependant que dans le cas du 
RTC, 

L' invention concerne la correction de ces 
distorsions spectrales par un traitement centralise, 
c'est~a-dire un dispositif installs dans la partie 
numerique du reseau, comme indique sur la figure 10 
pour le RTC. 

L^objectif d'' une correction du timbre de la voix 
est que le timbre de la voix en reception soit le plus 
proche possible de celui de la voix emise par le 
locuteur, que 1 ' on appellera voix originale. 

2. Etat de la technique 

Une compensation des distorsions spectrales 
.introduites dans le signal de parole par les divers 
elements de la liaison telephonique est permise a ce 
jour par des dispositif s a base d ' egalisation . Celle-ci 
peut etre fixe ou s ' adapter en fonction des conditions 
de transmission. 

2.1 L' egalisation fixe 
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Des dispositifs d'egalisation centralisee ont ete 
proposes dans les brevets US 5333195 [Duane O. Bowker] 
et US 5471527 [Helena S. Ho]. Ces egaliseurs sont des 
f litres fixes qui restaurent le niveau des basses 
frequences attenuees par I'emetteur. Bowker propose par 
exemple un gain de 10 a 15 dB sur la bande 100-300 Hz. 
Ces methodes presentent deux inconv6nients : 

* L'egaliseur ne compense que le filtrage de 
l-emetteur, de sorte qu'a la reception, les composantes 
basse-frequence restent fortement affaiblies par le 
filtrage SRI de reception. 

* Cette 6galisation fixe compense des conditions de 
transmission (ligne et systeme d' emission) moyennes. Sx 
les conditions reelles sont trop differentes (par 
exemple si les lignes analogiques sont longues)-le 
dispositif ne corrige pas suffisamment le timbre, voxre 
I'altere plus que la liaison sans egalisation. 

2 2 L' egalisation adaptative. 

Le dispositif decrit dans le brevet US 5915'235 
[Andrew P De Jaco] vise a corriger la repohse 
frequentielle non ideale d'un transducteur de telephone 
mobile. L'egaliseur est decrit comxne etant place entre 
le convertisseur analogique-numerique et le codeur 
CELP, mais peut etre aussi bien dans le terminal que 
dans le reseau. Le principe de 1 < Egalisation est de 
rapprocher le spectre du signal regu d'un spectre 
ideal. Deux -methodes sont proposees. 

La premiere methode (illustree par la figure 4 du 
brevet precite de De Jaco), consiste a calculer des 
coefficients d ' autocorrelation a long terme RLT : 
RLT(n.i) = aRLT(n-l,i)-Kl-«-)R(n,i), (0-2) 

avec RLT(n,i) i^^"^ coefficient d ' autocorrelation a 
long terme . la ni.me trame, -(n^D coefficient 
d. autocorrelation specif ique a la n^^ trame, et a 
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constante de lissage fix.e pa. exe.ple . 0,9^5^ Oe ces 
coefficients sent d.riv.s les coeff.cxents LPC a long 
terxne, qui sent • les coefficients d'un Ixltre 
terme, y sortie de ce filtre, le signal est 

blanchxsseur. A la sorrie ue . • ^ io<= 

-F-nt-r-*- fixe qui lui imprime les 
filtre par un filtre ixxe 

caract^ristiques spectrales i long teme ideales, .e 
"lies qu'll aurait , la sortie d'un t.ansducteur ayant 
L r^ponse f r^quentlelle id.ala. Ces deux filtres sent 
ccpl.t.a pa. un ,aln .ultlpllcatlf e,al au rappo.t 
entL les energies ^ long terme de 1' entree du 

■ blanchisseur et de la sortie da deuxieme f=.ltre. 

La deuxieme methode, illuatr^e par la figure 5 du 
brevet preoite de De Jaco, consiste i divlser le srgnal 
en sous-bandes, et, pour chaque .ous-bande, applr<,uer 
un gain multiplicatif de mani.re a atterndre une 

-ir, ,i+-P.nt defini coinme le rapport 
enerqie cible, ce gam etant aerinx 

e: re I'.nergie cible de la soua-.ande 

long terme (obtenue par un lissage de 1 energre 
instantanee) du signal dans cette sous-bande. 

ces deux mithodes pr6sentent 1 ' rnconvenient de ne 

^^r^ idp.;^le du systeme 
oorriger que la reponse non ideale 

■ rf. Emission et pas celle du systeme de reception. 

te drspositif du brevet US 59059S9 [CbafiK Mo.bel, 
a pour objet de compenser le filtrage ^V^teme 
emission et de la ligne d'abonn* pour ameliorer la 
reconnaissance centralisee de la parole et/ou la 
gualite de la parole transmise. Cc^ue le presente la 
• figure 3a de Mo.bel, le spectre du signal est drvxse en 
' sous-bandes, et cbague . .nergie de sous-bande est 
multioliee par un gain adaptatif, ^'adaptation du gaxn 
est ' r^alisee selon ralgorithme du gradient 
stochastigue, par minimisation de i'erreur guadratxgue 
l.erreur *tant d^finie comme la difference entre 
■ ..nergie de sous-bande et une .nergie de reference 
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definie pour chaque sous-bande . L'energie de reference 
est modulee a chaque trame par I'energie de la trame 
courante, de maniere a respecter les variations 
naturelles de niveau ^ court terme du signal de parole. 
La convergence de I'algorithme permet d'obtenir en 
sortie les 24 signaux de sous-bande egalises. 

Si 1' application visee est 1 ■ amelioration de la 
qualite vocale, le signal de parole egalise est obtenu 
par transformee de Fourier inverse des energies de 
sous-bande egalisees. 

Le brevet de Mokbel, ne mentionne pas de resultats 
en termes d ' amelioration de la qualite vocale, et 
reconnait que la methode est sous-optimale, en ce 
qu'elle realise une convolution circulaire. Par 
ailleurs, il est douteux qu'un signal de parole puisse 
etre reconstruit correctement par transformee .. de 
Fourier inverse d' energies de bandes distributes selon 
I'echelle MEL. Enfin, le dispositif decrit ne corrxge 
pas ie filtrage du systems de reception et de la Ix^ne 
analogique de reception. ,:. 

La compensation de I'effet de ligne est realx-see 
dans la methode « Mokbel », de soustraction cepstrale, 
dans' le but d'ameliorer la robustesse de la 
reconnaissance de la parole. On montre que le cepstre 
du canal de transmission peut etre estimt par le 
cepstre moyen du .. signal regu, celui-ci etant 
prealablement blanchi par un filtre de preaccentuatxon . 
Cette methode permet une nette amelioration des 
performances des systemes de reconnaissance, maxs est 
consideree comme une methode "off-line", 2 a 4 s etant 
ntcessaires pour ektimer le cepstre moyen. 

2 3 Un autre 6tat de la technique combine une pre- 
egalisation fixe et une 6galisation adaptee et a fait 
Jobjet du depat d' une .demande de brevet FR 2822999 par 
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•le Deposant. Le dispositif decrit vise a corriger le 
timbre de la parole en coxnbinant deux f litres. 

Un filtre fixe, appele pr6-egaliseur , compense les 
distorsions d'une liaison telephonique moyenne, definie 
comme etant constituee de deux lignes d'abonne moyennes 
et de systemes d' emission et de reception respectant 
les reponses f r6quentielles nominales definies dans 
[UIT-T, Recommandation P . 48 , App . I , 198 8 ] . Sa reponse 
fr^quentielle, sur la bande [Fc-3150 Hz], est 1 ' inverse 
de la reponse globale de la partie analogique de cette 
liaison moyenne, Fc etant la frequence basse limite 

d' egalisation . 

Cette pre-egalisation est completee par un 
egaliseur adapte, qui adapte la correction de maniere 
plus precise aux conditions reelles de transmission. .^La 
reponse f requentielle de 1" egaliseur adapts est donn^e 
par : 

1 frefC/) • (0 3) 

' ^^^^^ ^~\s_RXif)-L_mf)\i rAf) ' 

avec L_RX la reponse f requentielle de la ligne de 
reception, S_RX la reponse f requentielle du systems de 
reception et Y.(f) 1^ spectre a long terme de la sortie 
X du pre-egaliseur . : . - . 

' Le spectre ^ long terme- est d6f ini comme la moyenne . 
temporelle des spectres A court terme des trames 
successives de signal ; Jrm' ^PP^^.^ spectre de 
reference, est le spectre moyen de la parole defmi par 
I'UIT [UIT-T/P.50/APP. . I, 1998], pris comme 
approximation du spectre a long, terme original du 
locuteur. Du fait de cette approximation, la reponse 
f requentielle " de 1' egaliseur . adapte est tres 
irreguli^re et seule . sa forme , generale est pertinente. 
C'est pourquoi elle doit etre lissee. L-egaliseur 
adapte etant realise sous la forme d'un filtre temporel 
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RIF, ce Ussage dans- le domains fre.uentiel est obtenu 
pL un atrolt f.n.trage (symatrique) de la r.ponse 

imoulsionnelle . , 

cette methods per.et d. re.taurer un t.mbre proche 
de cslui du signal original sur la bande d' igal.sat.on . 

• [Fc-3150 Hz], mais : . . 4. ■ h« 1 <=nr 

• - pour certains locuteurs, 1 ' approxxmatxon de leur 

spectre . long ter.e original par le ^P-^- 
rLerence est tres grossiere, de sorte que I'egalxseur 
introduit une distorsion perceptible ; 

- le fort.lissage de la reponse frequentxelle de 
l-eqaliseur, rendu necessaire par I'erreur 

1 egaiiseur, ^^^^.^ de corriger des distorsions 

d' approximation, interdit de corrig« 

spectrales fines. ,v 

hnt de remedier -aux 

L' invention a pour but 

inconv.nients de I'.tat de la technique. ^^JJ^^ 

objet un proCd. et un syst.^e pour ■ -elxorer la 

correction du timbre en reduxsant 1 er^eur 

■ . • ^r, =.Dectre a long terme orxgxnal ^des 

d' approxxmatxon du spectre cx j. ^ . 

'°^"'r"et effet. 11 ■ e.t propos* de classer les 
locuteurs selon leur spectre 4 long terme t 
d-approcher celui-ci non plus par un spectre de 
r.ffrence unigue mais par un spectre de reference par 
classe. Le proCd.' propos. permet de rea un 
-traitement d'.galisation apte 4 determiner la classe^du 
locuteur et 4 4galiser suivant le spectre de reference 
dr Ta classe. Cette reduction de I'erreur 
a. approximation permet de lisser moins 
repoLe f r^guentielle de r.galiseur adapte le rendant 
apte . corriger des distorsions spectrales plus fines. 
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La presente invention a plus particulierement pour 
objet un procede de correction des deformations 
spectrales de la voix, introduites par un reseau de 
communication, comprenant une operation d'egalisatxon 
sur une bande de frequence [F1-F2] , adaptee a la 
distorsion reelle de la chaine de transmission, cette 
operation etant realisee au moyen d'un filtre numerique 
ayant une reponse f requentielle fonction du rapport 
entre un spectre de reference et un spectre 
correspondant au spectre a long terme du signal voix 
des locuteurs, principalement caract6ris6 en ce qu' il 
comprend : 

* Prealablement a 1' operation d' egalisation du 
signal voix d'un locuteur en communication : 

- La constitution de classes de locuteurs avec une 
reference de voix par classe, 

* Puis, pour un locuteur donne en communication : 

' - Le classement de ce locuteur c'est-a-dire son 
affectation a une classe a partir de criteres de 
classement pr^definis pour lui faire correspondre une 
r6f6rence de voix qui est la plus proche de la sxenne, 

- L'6galisation du signal numerise de la voix du 
locuteur operee avec comme spectre de reference, la 
reference de voix de la classe a . laquelle ledxt 
locuteur a ete affecte. 

Selon une autre caracteristique, la constitution de 

classes de locuteurs comprend : 

- Le choix d'un corpus de N locuteurs .enregistres 

. ^ArtvsHp'fic; • et la determination 

dans des conditions non degraoees ex., . 

de leur' spectre de- frequence a long terme, 

- La classification des locuteurs du corpus selon 
leur cepstre partiel c'est a dire le cepstre calcule a 
partir du spectre a long terme restreint a la bande 
d' egalisation rFl-F2] et en appliquant un critere de 
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classification predefini sur ces cepstres pour obtenir 
K classes, 

- Le calcul du spectre de reference associe a 
chaque classe de raaniere a obtenir une reference de voix 
correspondant a chacune des classes. 

Selon une autre caracteristique , le spectre de 
reference sur la. bande de frequences d' egalisation [Fl- 
F2], associe a chaque classe, est calcule par 
transformee de Fourier du centre de la classe defini 
par son cesptre partiel. 

Selon une autre caracteristique, la classification 

d'un locuteur coraprend : 

- L' utilisation du pitch moyen du signal voix et du 
cepstre partiel de ce signal comme parametres , .^de 
classement, 

- L' application d'une fonction discriminante a ces 
parametres pour classer ledit locuteur. 

Selon 1' invention le procede comprend en outre une 
etape de pre-6galisation du signal numerique par , un 
f litre • fixe ayant une reponse f requentielle dans , la 
bande de frequence [F1-F2] , correspondant a 1' inverse 
d'une deformation spectrale de reference introduite par 
ia liaison telephonique . 

Selon une autre caracteristique, 1 ' egalisation du 
signal numerise de la voix d'un locuteur comprend : 

- la detection d'une -activite vocale sur la ligne 
pour d^clencher un enchalnement de traitements 
comprenant le calcul du spectre a long terme, la 
classification du locuteur, . le calcul du module de la 
reponse" f requentielle du filtre egaliseur restreinte a 
la bande d' egalisation [F1-F2] et le calcul des 
coefficients du filtre numerique differencies selon la 
classe du locuteur, a partir de ce module. 
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la commande du filtre avec les coefficients 

obtenus, 

le filtrage du ' signal sortant du pre-egaliseur 
par ledit filtre. 
Selon une autre caracteristique, le calcul du 
module [EQ] de la reponse f requentielle du filtre 
egaliseur restreinte a la bande d' egalisation [F1-F2] 
est realise par la" mise en oeuvre de la relation 
suivante : 



dans laquelle Yref{f)est le spectre de reference de 
la classe a laquelle appartient ledit locuteur, 
et dans laquelle L__RX est la reponse f requentielle 
de la ligne de reception., S_RX la reponse 
f requentielle du systeme de reception et^x(f) le 
spectre a long terme du signal x d' entree du 
filtre. 

Selon une variante, le calcul du module de la 
reponse f requentielle du filtre egaliseur restreinte a 
la bande d' egalisation [F1-F2] est realise par la mise 
en oeuvre de la relation suivante : 

C!,=Clr-C'^~Cl,,-Cr^^. (0,13) 

dans laquelle C^,,, C^., C^.,,. et CP^r. sont les cepstres 
partiels- respectif s de 1^ egaliseur adapte, du signal 
d' entree x du filtre egaliseur, du systeme de reception 
et de la ligne de reception, C^ref etant le cepstre 
partiel de reference, centre de la classe du locut'eur. 
Le module [EQ] restreint a la bande '^^-^^ est alors 
calcule par Transformee de Fourier discrete de C^eq. 
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L'invention a egalement pour objet un systeme de 
correction des deformations spectrales de la voxx 
introduites par un reseau de conununication, comprenant 
des xnoyens d' egalisation adapt ee dans una bande de 
frequence [F1-F2] qui comportent un filtre numer.que 
dont la r^ponse .frequent ielle est fonction du rapport 
entre un spectre de .reference et un spectre 
correspondant au spectre a long terme d' un signal voxx, 
principalement caracterise en ce que ces moyens 

comprennent en outre : , i^ 

- des moyens de ' traitements du signal pour le 
calcul des coefficients du filtre num^rique munxs : 
d'un bloc de traitement du signal ^our 
calculer le module " de la reponse f requentie^le 
■ du filtre egaliseur restreinte a la ba|ide 

. • T■c^ COT «5*:»lon la relation 

d' egalisation [F1-F2] sexon 

suivante : - ' s- 

1 lz5Zl • (0.3) 

. ^ans laquelle Y.e.(f)est le spectre 'de reference 
. qui peut #tre different d'un locuteur a un autre et 

qui correspond a une reference de classe 

pr^d^terminee a laquelle appartient ledit locuteur, 
et dans laquelle L_RX est la reponse f requentxelle 
de la ligne de reception, S_RX la reponse 
• f r^quentielle . du systeme de reception et Y.(f>,^^ 
spectre a long terme du signal x d' entree du 
filtre; ' ' - ' 

. d'un deuxieme bloc de traitements pour le 

calcul de la reponse impulsionnelle a partxr du 
module de reponse f requentielle ainsi calcule. 
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afin de determiner les coefficients du filtre 
diffferencies selon la classe du locuteur . 

Selon une autre caracteristique, le premier bloc de 
traitement comprend des moyens de calcul du cepstre 
partiel du filtre egaliseur selon la relatxon : 
C=Cr-C^-C.%,-C,%' (0.13) 
dans laquelle C.. C.,.„ et sent ^^fj/ 

partiels respectifs de I'.galiseur adapte, du s.gnal 
d entr.e k du filtre Egaliseur, du systerae de reception 
et de la ligne de reception, 0^.. ^tant le cepstre 
partiel de r.f.rence, centre de la classe du locuteur, 
parT-xej. ^ . ^ - 1 , v,anr!e» F1-F2 est alors 

le module de [EQl restremt a la bande Fl FZ 
calcule par Transformee de Fourier Discrete de C e. 

selon une autre caract.ristique , le premier bloc de 
traitements comprend un sous-ensemble pour calculer les 

^ ^ r^=.r-i-ie>T d' un locuteur en 
coefficients du cepstre partxel d u 

coKonunication et un deuxieme sous-ensemble pour operer 

locuteur, ce deuxi^me sous-ensemble 
le classement de ce locuteur, 

comprenant un bloc de ^^^^^^^^^f J;',, ..i^.i, 
d' estimation du pitch moyen a partxr du px 

et un bloc de classement appliquant une fonctxon 
■ d 'scriminante sur le .vec.eur x ayant pour co-osant 
le pitch moyen et les coefficients du cepstre partxel 
pour classer ledit locuteur. 

selon 1' invention, le systeme comprend en outre 
pre-egaliseur, le signal egalxse a parrxr de P 
de reference differencxes selon la classe 
etant le signal x de sortie du pr6-egaliseur - 

D'autres particularites et avantages de 
invention apparaitront clairement dans la •^e-rxptxo 
suivante, qui est donn.e A titre d' exemple xllus.ratxf 
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et non iimitatif at qui est faite en regard des figures 

annexees qui representent : i^x^^^^c^^. 

-La figure 1, une liaison telephonxque schemat.see 
pour un reseau telephonique commute (RTC) , 

La figure 2, la courbe de reponse frequentielle 
en emission du systeme de reference intermediaire SRI 

La figure 3, la courbe de reponse f requentxelle 
en reception du systeme de reference intermediaire SRI 

-La figure 4, la reponse en frequence des Ixgnes 
d'abonnes selon leur longueur, . , -, . ^ 

- La figure 5,le gabarit du filtre antx-replxement 

du codeur MIC, vi-^o 
. La figure 6, les distorsions spectrales subxes 

par la parole sur le r.seau t.l^phonigue ^^^^^ 
SRI moyen et diff^rentes combinaxsons de Ixgnes 

analogiques !■ emission pour les 

- La figure 1, gaoaiXL. 

terminaux numeriques, - 

La figure 8, le gabarit a la ricepticn pour aes 

terminaux numerigues ^ spectrale introduite 

^ La figure 9, la aisrorsiun ^ . i 

par le codage-decodage GSM en mods EFR (Enhanced Full 

La figure 10, le schema d'un r.seau de 

• . * i.r. c;vsteme de correction des 

communication avec un systeme 

distorsions de la parole, ' i Hu ceostre 

Ti i^r^c; etapes de calcul du cepstre 

- La figure 11/ i^s ex^<AiJ^^ ^. 

"""'lI figure 12, la clasaif ication des cepstres 
partiels selon le crit^re de la variance. 
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- Les figures 13a et 13b, les spectres a long terme 
correspondant aux centres des classes de locuteurs 
respectivement pour hommes et feiranes, 

- La figure 14, les caract^ristiques f requentielles 
des filtrages appliques au corpus pour definir le 
corpus d' apprentissage, 

- La figure 15, la reponse f requentielle du pre- 
egaliseur pour differentes frequences Fc, 

- La figure 16, le schema de realisation du systeme 
de correction par egalisation differenciee par classe 
de locuteurs, 

- La figure 17, une variante d' execution du systeme 
selon la figure 16. 

Dans toute la suite les memes references portees 
sur les dessins correspondent aux memes Elements. 

La description qui va suivre va d'abord presenter 
I'etape pr6alable de "classification d' un corpus de 
locuteurs selon leur spectre ^ long terme. Cette etape 
permet de definir K classes et une reference par 
classe . 

Un enchainement de traitements permet de traiter le 
signal de parole (des la detection d'une activite 
vocale par le systeme) de cheque locuteur pour d'une 
part classer les locuteurs c'est a dire les affecter a 
une classe selon des criteres predetermines et pour 
d' autre part corriger la voix en utilisant la reference 
de la classe du locuteur. 

Etape prealable de classification des locuteurs.. 

* Choix du corpus de definition des classes. 

Le spectre de reference etant une approximation du 
spectre a long terme original des locuteurs, la 
definition des classes de -locuteurs et de leurs 
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spectres de r6£6rance respectifs necessite de disposer 
d'un corpus de locuteurs enregistris dans des 
conditions non dagrad^es. En particulier, le spectre a 
long terme d'un locuteur n.e=ure sur cet enreg.strement 
doit pouvoir 6tre consider^ oomme son spectre original, 
i.e. celui de sa voix i rentrtoit* d'*mission d'une 
liaison telephonique. ^ 

Definition de 1 ■ individu : le cepstre partxel. 
Le traitement propose permet de disposer, dans 
chaque classe, d-un spectre de reference le plus proche 
possible du spectre a long terxne de chaque menO^re de la 
c3asse. Cependant, seule la partie du spe-ctre comprise 
dans la bande d ' egalisation F1-F2 est prise en compte 
dans le traitement d' egalisation adaptee. Les classes 
sont done constitutes selon le spectre a long^ terme 

restreint a cette bande. 

D' autre part, la - comparaison entre deux spectres 
est effectuee a un faible niveau de resolution 

- r-f^-FlPter aue I'enveloppe 

spectrale, de maniere a ne refleter que 

spectrale. Cest pourquoi, on se place de P^^'^^. 
dans 1-espace des premiers coefficients cepstraux 
d^ordre sup.rieur . 0 (le coefficient d'ordre 0 

. - ' ^\ rhoix du nombre de 

representant I'energie)., le cnoix 

Efficients dependant de la resolution spectrale 

'°^"on':.termine done dans le traitement, le "cepstre 
partiel ^ long terme", que I'on note Cp, comme la 
representation cepstrale du spectre . long te.me 
restreint a une bande de frequence. Si 1 ' on note kl et 
.2 les indices de frequence correspondant 
respectivement aux frequences. Fl et F2 , et y ^P-^^ 
.a- long terme de la parole, le cepstre partxel est 
dtfini par la relation : 

C''=TFD-'(l0log(y(fc,...^2)°y(^2-l--^.+0)) ^^'"^^ 
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ou • designs 1' operation de concatenation. 
La (TFD) Transformee de Fourier Discrete Inverse 
est calculee par exemple par IFFT apres interpolation 
des echantillons du spectre tronque de maniere a 
atteindre un nombre d ' echantillons puissance de 2. Par 
exemple, en choisissant la bande d' egalisation 187-3187 
Hz, correspondant aux indices frequent iels 5 a 101 pour 
une representation du spectre (symetrise) sur 256 
points (de 0 a 255), 1 ' interpolation se fait simplement 
en intercalant une raie f requentielle (interpolee 
lineairement) toutes les trois raies dans le spectre 
restreint a 187-3187 Hz. 

Les etapes du calcul du cepstre partiel sont 
representees sur la figure 11. 

Pour que les coefficients cepstraux ref letent 
I'enveloppe spectrale mais pas 1' influence de la 
structure harmonique du spectre de la parole sur les 
spectres a long terme, on ne conserve pas les 
coefficients d'drdre elev§. Les locuteurs a classer 
sont done repr6sent6s par les coefficients d'ordres 1 a 
L de leur cepstre partiel a long terme, L valant 

typiquement 20. 

* La Classification. 

Les classes sont constituees par exemple de maniere 
non-supervisee, selon une classification hierarchique 
ascendante . 

Celle-ci consiste a creer, a partir de N individus 
disjoints, une hierarchie de partitions selon le 
processus suivant : a- chaque etape, on agrege les deux 
elements les plus proches, un element etant soit un 
individu non agrege, soit un agr6gat d' individus 
constitu6 lors d'une precedente etape. La proximite 
entre deux 616ments est determin^e par une mesure de 
dissimilarite que 1 ' on appelle distance. Le processus 



1 er depot 



19 



se poursuit jusqu'a I'agregation de toute la 
population. La hierarchie de partitions ainsx creee 
peut se representer sous la forme d'un arbre comme 
celui de la figure 12, contenant N-1 partitions 
imbriquees. Chaque coupure de 1 ' arbre fournit una 
partition, d'autant plus fine que 1 ' on coupe bas . 

Dans ce type de classification, on choisit comme 
mesure de distance entre deux Elements, la variation 
d'inertie intra-classes resultant de leur agregatxon. 
Une partition est en effet d'autant meilleure que les 
classes creees sont homogenes, c'est-a-dire que 
I'inertie intra-classes est faible. Dans le cas d'un 
nuage de points xi de masses respectives mi, repartrs 
en classes q de centres de gravite respectifs gq, 
I'inertie intra-classes est definie par : 

EL"-. Ik -4- ("-'^ 



q icq 



L'inertie intra-classes, nulle a I'etape initiale 
de I'algorithme de calcul, s'accroit inevitablement a 

chaque agregation. jv 

on utilise de preference le principe connu 
I'agregation selon la variance. Selon ce principe on 
recherche, a chaque etape de I'algorithme mis en 
oeuvre, les deux elements dont I'agregation produxt 
1' augmentation d'inertie intra-classes la plus farble. 

La partition ainsi obtenue est am^lioree par une 
procedure d' agregation autour des centres mobiles, qux 
permet de reduire la variance, intra-classes . 

Le spectre de reference, sur la bande F1-F2, 
associe a chaque classe est calcule par transform^e de 
Fourier du centre de la classe. 

* Exemple de classification 

Le traitement decrit ci-dessus est applique a un 
corpus de 63 locuteurs. L'arbrede classification du 
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1 -Ft/^itt*:^ 17 Dans cette 
corpus est represente sur la figure 12. ua 

representation, la hauteur d'un segment horizontal 
agregeant deux elements est choisie proportionnelle a 
leur distance, ce qui permet de visualiser la proxxmxte 
des elements regroupes dans une meme classe. Cette 
representation facilite le choix du niveau de coupure 
de I'arbre, et done des classes retenues. La coupure 
doit etre faite au-dessus des agregations de niveau 
faible, qui regroupent des individus proches, et en 
dessous des agregations de niveau eleve, qui associent 
des groupes d' individus bien distincts. 

De cette maniere, on obtient de fagon nette quatre 
classes (K= 4). Ces classes sont assez homog.nes du 
point de vue du sexe des locuteurs, et une coupure de 
I'arbre en deux classes fait apparaitre a peu pres une 
classe hommes et une classe femmes. 

La consolidation • de cette partition par une 
procedure d'agregation autour des centres mobiles 
Loutit a quatre classes de cardinaux 11, 18, 18 et 16, 
plus homogenes que precedemment du point de vue du sexe 
seuls un homme et deux femmes sont affectes a des 
classes ne correspondant par . ' 

Les spectres restremts a la bande 
correspondant' aux .. centres de .ces classes sont 
repr.sent.s sur les figures 13a et 13b pour les classes 
holes et fer^es ainsi que pour, leurs sous-classes 
respectives. Ces spectres, resultats de la 
classification, sont utilises conuue reference, multiple 

par I'egaliseur adapts. , .. ^ . 

• ' . . X.- r-ri teres de classement des 

* • Utilisation ■ de crir^ert^i^ 

•• ' • Les classes de locuteurs . etant defmies, le 
traitement prevoit 1 ' utilisation de parametxes et des 
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criteres pour affecter un locuteur a 1 ' une ou 1'. autre 
des classes. 

Cette affectation n'est pas realisee simplement 
selon la proximite du cepstre partial avec un des 
centres de classes, puisque ce cepstre est devie par la 
partie de la liaison telephonique en amont de 

1 ' egaliseur . • • 

II est propose avantageusement d'utiliser des 
criteres de classernent robustes k cette deviation. 
Cette robustesse est assuree a la fois par le choix des 
parametres de classernent et par celui du corpus 
d'apprentissage des criteres de classernent. 

* De preference on utilise les parametres de 
classernent : pitch moyen et cepstre partiel. :> 

Les classes precedemment definies sont homogenes -.du 
point de vue du sexe. Le pitch moyen etant a la fois 
assez discriminant pour- un classernent homme / f emme -et 
insensible aux distorsions spectrales induites par une 
liaison telephonique, il est done utilise cormne 
parametre de classement, conjointement avec le cepstre 
partiel. 

* Choix du corpus d'apprentissage des criteres de 
classernent. ... . 

On applique a ces parametres une technique de 
discrimination par exemple la technique usuelle de 
1' analyse lineaire discriminante . 

D'autres techniques connues peuvent etre utilisees 
telles qu'une technique non lineaire utilisant un 
r^seau de neurones. 

Si I'on dispose de N individus decrits par des 
vecteurs de dimension p et repartis a priori en K 
classes', 1' analyse lineaire discriminante consiste : 

- dans un premier temps, a chercher les K-1 
fonctions lineaires independantes qui separent au mieux 
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les K classes. II s ' agit de determiner quelles sont les 
combinaisons lineaires des p composantes des vecteurs 
qui minimisent la variance intra-classes et maximisent 
la variance interclasses . 

- dans un deuxieme temps, a determiner la classe 
d'un nouvel individu par application des fonctions 
lineaires discriminantes au vecteur le representant . 

Dans le cas present, les vecteurs representatif s 
des individus ont pour composantes le pitch et les 
coefficients 1 a L ( typiquement , L = 20) du .cepstre 
partiel. La robustesse des fonctions. discriminantes a 
la deviation des coefficients cepstraux est assuree a 
la fois par la presence du pitch dans les pararaetres et 
par le choix du corpus d' apprentissage , Celui-ci est 
compose d' individus dont la voix originale a subi une 
grande diversite de filtrages representatif s des 
distorsions occasionnees par les liaisons 

telephoniques . 

Plus precisement, a partir d ' un corpus de voix 
originales (non degradees) de N locuteurs, on definit 
un corpus de N vecteurs de composantes [F^ ; C^(l) ; ... ; ], 
avec ^ le pitch moyen et C le cepstre partiel. La 
construction du corpus d ' apprent issage desdites 
fonctions consiste a definir un ensemble de M biais 
cepstraux qui s'ajouteront chacun a chaque cepstre 
partiel representatif d'un locuteur du corpus original, 
ce qui permet d'obtenir un nouveau corpus de NM 
individus * 

* Ces biais dans . le domaine du cepstre partiel 
correspondent - a une- large gamme • de distorsions 
spectrales sur " • la bande F1-F2, proches de celles 
pouvant resulter de la liaison telephonique . 

A titre d'exemple, on propose 1' ensemble de 
reponses f requentielles representees sur la figure 14 
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pour la bande 187-3187 Hz : chaque reponse 
frequentielle correspond a un chemin de gauche A droite 
dans le treillis. L' amplitude de leurs" variations sur 
cette bande n'excede pas 20 dB, a I'instar des 
caracteristiques extr^males des systemes d" emission et 
lignes . 

A partir de ces 81 caracteristiques f requentielles 
sent calcules les Bl' biais correspondant s dans le 
domaine du cepstre partiel, selon le traitement decrit 
pour la mise en ceuvre de la relation (0.4). Par 
addition de ces biais au corpus de 63 locuteurs 
precedemment ■ utilise, on obtient un corpus 
d'apprentissage comptant 5103 individus representatif s 
de diverses conditions (locuteur, filtrage de ;la 

liaison) . ' 

Dans le cas de classement par analyse lineaire 

discriminante : 

* Application des criteres de classement. 

Soit (a^yi^k^K-l la famille de fonctions lineaio^es 
discriminantes d6finies a partir du corjSAis 
d'apprentissage. Un locuteur represents par le vecteiir 
^^j-;^ .CP(1). ... ; <y{L)] est affecte a la classe q si la 
probabilite conditionnelle de q sachant a(x), notee 
P(q|a(x)), est maximale, a (x) designant le vecteur de 
composantes (a" (x) ) l^k^K-1 . Selon le theoreme de Bayes, 

Par consequent, P(q|a(x)) est proportionnelle a 
P{a(x) Iq) P(q) . Dans le sous-espace engendre par les K-1 
fonctions discriminantes, sous I'hypothese d'une 
distribution multi-gaussienne des individus dans chaque 
classe, la densite de probabilite de a(x) a I'interieur 
de la classe q a pour expression : 
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f,{x) = ,l_expU(a(.)-a(F))'V(«W-«(^^))l^ 

ou 3c' est le centre de la classe q, I Sq | designe le 
determinant de la matrice Sq, et Sq est la matrice des 
covariances de a a I'interieur de la classe q, 
d' element generique a*^ j k que 1 ' on peut estimer par : 

L'individu x sera ' affect6 k la classe q qui 
maximise fq(x)P(q), ce qui revient a minimiser sur q la 
fonctibn sq(x) appelee score discriminant : 



Le proc6d6 de correction propose est mis en osuvre 
par le systeme de correction (egaliseur) implante dans 
le reseau num^rique 40 comme I'illustre la figure 10. 

La figure 16 illustre le systeme de correction apte 
a mettre en ceuvre le precede . La figure 17 illustre ce 
systeme selon une variants de realisation comma cela va 
etre detaille dans la suite. Ces variantes portent sur 
le mode de calcul du module de la reponse. f requentielle 
de 1' egaliseur adapte restreinte k la bande Fl— F2 . 

Le pre-egaliseur 200 est un filtre fixe, dont la 
reponse f requentielle, sur la bande F1-F2, est 
i ' inverse de la reponse globale de la partie analogique 
d'une liaison moyenne telle que d^finie- precedemment 
[0IT-T/P.830, 1996]. 

La raideur 'de la reponse f requentielle de ce filtre 
'implique une reponse impulsionnelle longue ; c'est 
pourquoi, de maniere a limiter le retard introduit par 
le traitement, le pre-egaliseur est realise typiquement 
sous forme d'un filtre RII, d ' ordre 20 par exemple. 
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La figure 15 represente les reponses f requentielles 
typiques du pre-egaliseur pour trois valeurs de Fl . La 
dispersion des retards de groupe est inferieure a 2 ras, 
de sorte que la distorsion de phase resultante n'est 
pas perceptible. 

La chaine de traitement 400 qui suit permet le 
classement du locuteur et 1 ' egalisation adaptee 
differenciee. Cette chaine comprend deux blocs de 
traitements 400A et 400B. Le bloc 400A permet de 
calculer le module de la r^ponse f requentielle du 
filtre egaliseur restreinte a la bande d' egalisation : 

EQ dB [F1-F2] . 

Le deuxieme bloc 4 GOB permet de calculer la reponse 
impulsionnelle du filtre egaliseur afin d' obtenir les 
coefficients eq(n) du filtre diff^rencies selon la 

classe du locuteur. 

Un detecteur de trames d'activite vocale 401 permet 
de declencher les differents traitements. 

Le bloc de traitement 410 permet le classement du 

' locuteur. i<. 

Le bloc de traitement 420 permet de calculer le 
spectre a long terme suivi du calcul du cepstre 
partiel de ce locuteur. 

• ■ La sortie de ces deux blocs est appliquee sur 
I'operateur 428a ou 428b. La sortie de cet operateur 
fournit le module de la "reponse f requentielle de 
1' egaliseur adapts "en dB . restreinte a la bande 
d'6galisation F1-F2 via le bloc 429 pour 428a, via le 

•bloc 440 pour 428b. 

Les blocs de traitement 4 30 a 4 35 permettent de 
calculer les coefficients eq(n) du filtre. 

.. La sortie x(n) du pre-egaliseur est analysee par 
trames successives d'une duree typique de 32 ms, avec 
un recouvrement inter-trames de 50 % typiquement. On 
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ouvre pour cela une fenetre d' analyse representee par 
las blocs 402 et 403. 

L' operation d ' egalisation adaptee est mise en ceuvre 
par un filtre RIF 300 dont les coefficients sont 
calcules a chaque trame d' activity vocale par la chaine 
de traitement illustree sur les figures 16 et 17. 

Le calcul de ces coefficients correspond au calcul 
de la reponse impulsionnelle du filtre a partir du 
module de la reponse f requentielle . 

Le spectre a long terme de x{n), yx, est d'abord 
calcule (a partir de 1' instant initial de 
fonctionnement) sur une fenetre temporelle croissant de 
0 a une duree T d'activite vocale (typiquement 4 s) , 
puis a juste recursivement a chaque trame d'activite 
vocale, ce qui se traduit par la fo rmule g6n6rique 
suivante : 

y,(/,«)^a(«)|jr(/,«)f + (i-«(«))y,(/,«-i), (0.10) 

ou Yx {f,n) est le spectre a long terme de x a la 
ni^me trame d'activite vocale, X(f,n) la transformee de 
Fourier de la nieme trame d'activite vocale, et a(n) 
est defini par la relation (0.11). En notant N le 
■ nombre de trames 'dans la duree T, • / 

«(«)=-— f-—. (0.11). • 



Ce calcul est opere par les blocs 421, 422, 423. 

On calcule ensuite, a partir , de ce . spectre a long 
terme le cepstre partiel .Cp, selon . la. relation (0.4) 
mise en ceuvre par ' les blocs de traitement 424, 425, 

426. _ 

Le pitch moyen ^« . est estime par le bloc de 
traitement 412 a chaque trame voisee selon la formule : 
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Fo (m) - a (m) (m) + (1 - a (m)) F,{m-^\) ^ ^ ^ 3 ) 

ou FO (m) est le pitch de la mieme trame voisee et 
est calcule par le bloc 411 selon une methode 
appropriee de I'etat de I'art (par exemple methode de 
1 ' autocorrelation, avec determination du voisement par 
comparaison de 1 ' autocorrelation normalisee a un seuil 
[UIT-T/G. 729, 1995] ) . 

Ainsi, a chaque trame d'activite vocale, on 
dispose d'un nouveau vecteur x de composantes le pitch 
moyen et les coefficients 1 a L du cepstre partiel, 
auquel on applique la fonction discriminante a definie 
a partir du corpus d' apprentissage . Ce traitement est 
mis en oeuvre par le bloc 413. Le locuteur est al(grs 
affecte a la classe q de score discriminant minimal, -a 

Le module en dB de la reponse f requentielle de 
I'egaliseur adapte restreinte a la bande F1-F2, note. 
|EQ|dB[Fi-F2i/ est calcule selon 1 ' une des deux methodes 
suivantes : 

La premiere methode (figure 16) consiste a calcuier 
|EQIfi-f2 selon Inequation (0.3), ou YreKO est le spectre 
de reference de la classe du locuteur (transformee de 
Fourier du centre de la classe) . Cette methode de 
calcul est mise en oeuvre dans cette variante 
representee sur la figure 16 avec les operateurs 414a, 
428a, 427 et 429. 

La deuxieme methode (figure 17) consiste a 
transcrire 1' equation (0.3) dans le domaine du cepstre 
partiel, puisque I'on dispose du cepstre partiel de la 
sortie -x du pre-egaliseur , necessaire au classement du 
locuteur. Ainsi, Inequation (0.3) devient : 

C!, = Cf^r - - C ^ - Q% , (0. 1 3) 
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ou C?^g, C^;,, C^^_^ et 0*1^ sont les cepstres partiels 
respectifs de I'egaliseur adapte, de la sortie x du 
pre-egaliseur , du systeme de reception et de la ligne 
de reception, C^ref etant le cepstre partiel de 
reference, centre de la classe du locuteur. Les 
cepstres partiels sont calcules comme indique 
precedemment , en selectionnant la bande de frequences 
F1-F2. Ce calcul est effectue uniquement pour les 
coefficients 1 a 20, les coefficients suivants etant 
inutiles car rep.resentatif s d'une finesse spectrale qui 
sera eliminee par la suite. 

Les 20 coefficients du cepstre partiel de 
I'egaliseur adapte sont obtenus par les operateurs 414b 
et 428b selon la relation (0.13). 

Le bloc de traitement 441 complete ces 20 
coefficients par des zeros, les symetrise et calcule, a 
partir du vecteur ainsi forme, le module en dB de la 
reponse f requentielle de I'egaliseur adapte restreinte 
a la bande F1-F2 en mettant en oeuvre la relation 
suivante : 

, £a.B|^.^^=TFD-'(Ci;). (0.14) 

Cette reponse est decimee d' un facteur ^ par 
I'operateur 442, 

Pour les deux variantes qui viennent ^ d'etre 
decrites, les valeurs' de I EQ | hors de la ' bande F1-F2 
sont calculees par extrapolation lineaire de la valeur 
en dB de |EQIri-F2f notee EQdB par la suite; par le bloc 
430 et de la maniere suivante : 

Pour chaque indice de frequence k, 1 ' approximation 
lineaire de EQdB s ' exprime par : 

mM = ^i-^^2k (0.15) 
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Les coefficients al et a2 sont choisis de maniere a 
minimiser I'erreur quadratique de 1 ' approximation sur 
I'intervalle F1-F2, definie par 



k=k. 



(0.16) 



Les coefficients al et a2 sont done definis par 



. a 



2 J 



-^1 +1 



(0.17) 



reponse 



est obtenue 
lEQI realisee 



par 
par 



line 
les 



Les valeurs de |EQ1, en dB, hors de la bande F1-F2, 
sont alors calculees a partir de la forraule (0.15). ^ 

La caracteristique en frequence ainsi obtenue " doit 
§tre lissee. Le filtrage etant realise dans le domarane 
temporel, le moyen permettant ce lissage est ^ de 
multiplier par une fenetre etroite la 
impulsionnelle correspondante . 

La reponse impulsionnelle 
operation IFFT appliquee sur 
blocs 431 et 432 suivie d'une symetrisation realisee 
par le bloc de traitement 4 33, de maniere a obtenir un 
f litre causal a phase lineaire. La reponse 
impulsionnelle r^sultante est multiplies, operateur 
435, par une fen§tre temporelle 434. La fenetre 
utilis^e est typiquement une fenetre de Hamming de 
longueur 31 . centree sur le pic de la reponse 
impulsionnelle et est appliquee sur la reponse 
impulsionnelle au moyen de 1 ' operateur ' 4 35 . 
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KEVENDICATIONS 

1. Procede de correction des deformations 
spectrales de la voix, introduites par un reseau de 
cormnunication, comprenant une operation d' egalisation 

5 sur une bande de frequence [F1-F2] , adaptee a la 
distorsion reelle de la chalne de transmission, cette 
operation etant realisee au moyen d'' un filtre numerique 
ayant une reponse f requentielle fonction du rapport 
entre un spectre de reference et un spectre 

10 correspondant au spectre a long terme du signal voix 
des locuteurs, caracterise en ce qu'il comprend : 

* Prealablement a 1' operation d' egalisation du 
signal voix d'un locuteur en communication: 

- La constitution de classes de locuteurs avec une 
15 reference de voix par classe^ 

* Puis, pour un locuteur en communication donne : 

- Le classement de ce locuteur c'est-a-dire son 
affectation a une classe a partir de criteres de 
classement predefinis pour lui faire correspondre une 

20 reference de voix qui est la plus proche de la sienne, 

- egalisation du signal numerise de la voix du 
locuteur- - operee avec comme spectre de reference, la 
reference de voix de la classe a laquelle ledit 
locuteur a ete affecte, 

25 , 

2. Procede de correction des "^def ormations 
spectrales de la voix selon la revendication 1, 
caracterise en ce que : 

La . constitution de classes de locuteurs 
30 comprend : . 
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- Le choix d' un corpus de N locuteurs enregistres 
dans des conditions non degradees et la determination 
de leur spectre de frequence a long terme, 

- La classification des locuteurs du corpus selon 
leur cepstre partial c'est a dire le cepstre calcule a 
partir du spectre a long terme restraint a la bande 
d' egalisation, [F1-F2] et en appliquant un critere de 
classification predefini sur ces cepstres pour obtenir 
K classes, 

- Le calcul du spectre de reference associe a 
chaque classe de maniere a obtenir une reference de voix 
correspondant a chacune des classes- 

3. Procede de correction des de format i^)ns 
spectrales de la voix selon la revendication '2, 
caracterise en ce que le spectre de reference sur'. la 
bande de frequences d' egalisation ' [F1-F2] , associe a 
chaque , classe, est calculi ^ par transformee de Fourier 
du centre de la classe defini par son cesptre partieT' 

4. Procede de correction des deformations 
spectrales de la voix seion la revendication \, 
caracterise en ce que : 

* La classification d*un locuteur comprend : 

- L' utilisation du pitch moyen du signal voix et du 
cepstre partiel de .^ce signal comme parametres de 
classement , 

- L' application d'une fonction discriminante a ces 
parametres pour classer ledit locuteur. 

5. Procede de correction des deformations 
spectrales de la voix selon' I'une quelconque des 
revendications precedentes, caracterise en ce qu'il 
comprend en outre une etape de pre-egalisation du 
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signal numerique par un filtre fixe ayant une reponse 
frequentielle dans la bande de frequence [F1-F2], 
correspondant a 1' inverse d'une deformation spectrale 
de reference introduite par la liaison telephonique . 

5 

6. Proced^ de correction des deformations 
spectrales de la voix selon I'une quelconque des 
revendications precedentes, caracterise en ce que 
I'egalisation du signal numerise de la voix d' un 
10 locuteur comprend : 

- la detection d'une activite vocale sur la ligne 
pour declencher un enchalnement de traitements 
comprenant le calcul du spectre a long terrae, la 
classification du locuteur, le calcul du module de la 

15 reponse frequentielle du filtre 6galiseur restreinte a 
la bande d' egalisation [F1-F2] et le calcul des 
coefficients du filtre numerique diff^rencies selon la 
classe du locuteur, a partir de ce module,' 

- la commande du filtre avec les coefficients 

20 obtenus, 

- le filtrage du signal sortant du pre-egaliseur 

par ledit filtre. 
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7. .Precede de correction des deformations 
spectrales de la voix selon la^ ' revendicat ion 6, 
caracterise en ce que le calcul du module de la reponse 
frequentielle du filtre egaliseur restreinte a la bande 
d' egalisation [F1-F2] est realise par la mise en oeuvre 
de la relation suivante : 



1 ' hrM) (0.3) 



dans laquelle Vree (-f ) est le spectre de reference de 
la clause a laquelle appartient ledit locuteur. 



1 er depot 



33 



et dans laquelle L_RX est la reponse f requentielle 
de la ligne de reception, S_RX la r6ponse 
f requentielle du systdme de reception et yx{f) le 
spectre a long terme du signal x d' entree du 
f litre. 

8. Precede de correction des deformations 
spectrales de la voix selon la revendication. 6, 
caracterise en ce que le calcul du module [EQ] de la 
reponse f requentielle du filtre egaliseur restreinte i 
la bande d' egalisation [F1-F2] est realise par la mise 
en ceuvre de la relation suivante : 

r-p -r-p -rP-C -C? (0.13) 

dans laquelle CP,,, C?., . C^s^r. et C?,_„ sont les cepstires 
partiels respectifs de 1' egaliseur adapte, " du 
signal d' entree x du filtre egaliseur, du systeme 
de reception et de la ligne de reception, C?ref 
etant le cepstre partiel de reference, centre de^' la 
classe du locuteur ; le module [EQ] restreint i-la 
bande F1-F2 etant calcule par Transform^e ' de 
Fourier Discrete de C^eq. • 

9. Systeme de ^correction des deformations 
spectrales de la voix, introduites par un reseau de 
communication, compfenant des moyens d' egalisation 
adaptee dans une bande de frequence [F1-F2] qui 
comportent un filtre num6rique (300) dont la reponse 
f requentielle est fonction du rapport entre un spectre 
de reference et un spectre correspondant au spectre a 
long terme d' un signal voix, caracterise en ce que ces 
moyens comprennent en outre : 

- des moyens de traitement du signal (400) pour le 
calcul des : coefficients du filtre numerique munis : 
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® d'un premier bloc 'de traitements {400A) du 
signal pour calculer le module de la reponse 
f requentielle du filtre egaliseur restreinte a 
la bande d' egalisation [Fl~F2] selon la relation 
suivante : 

dans laquelle Yref(f)est le spectre de reference, 
qui peut etre different d' un locuteur a un autre et 
qui • correspond a une reference de classe 
predeterminee a laquelle appartient ledit locuteur, 
et dans laquelle L_RX est la reponse f requentielle 
de la ligne de reception, S_RX la reponse 
f requentielle du systeme de reception et Yxif) le 
spectre a long terme du signal x d' entree du 
filtre; 

• d'un deuxieme bloc de traitements (400B) pour 

le calcul de la reponse impulsionnelle a partir 
du module • de reponse frequentielle ainsi 
calcule,- afin de determiner les. coefficients du 
, filtre diff erencies ^ selon la classe du locuteur 

10. Systeme de correction des deformations 

spectrales de la voix selon la revendication 9, 
caracterise en ce que le premier bloc de traitements 
(400A) comprend des moyens (414b, 428b) de calcul du 
cepstre partiel du filtre egaliseur selon la relation : 

c^=Q^r-c;---c^-c;^, (o.n) 

dans laquelle C^,^, C^,, C^,_., et c7/_,, sent les cepstres 
partiels respectifs de 1» egaliseur adapte, du signal 
d' entree x du filtre egaliseur, du systeme de reception 
et de la ligne de reception, C^ref etant le cepstre 
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partial de reference, centre de la classe du locuteur ; 
le module [EQ] restreint ^ la bande F1-F2 etant calcule 
par Transform6e de Fourier Discrete de C^eq. • 

11. Systeme de correction des deformations 
spectrales de la voix selon la revendication 9 ou 10, 
caracterise en ce que le premier bloc de traitements 
comprend un sous-ensemble (420) pour calculer les 
coefficients du cepstre partiel d'un locuteur en 
communication et un deuxieme sous-ensemble (410) pour 
operer le classement de ce locuteur, ce deuxieme sous 
ensemble comprenant un bloc (411) de calcul du pitch Fo, 
un bloc (412) d' estimation du pitch moyen k partir du 
pitch calcule Fo, et un bloc (413) de classement 
appliquant une fonction discriminante sur le vecteur x 
ayant pour composantes le pitch moyen et les 
coefficients du cepstre partiel pour classer ledit 
locuteur. 

12. Systeme de correction des deformations 
spectrales de la voix selon I'une quelconque ades 
revendications 9 a 11, caracterise en ce qu' il comprend 
un pre-egaliseur (200) et en ce que le signal egalise a 
partir de spectres de reference differencies selon la 
classe du locuteur est le signal x de sortie du pre- 
egaliseur. 
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